<玩轉大語言模型> LLM模型部屬: Ollama

2024 iThome 鐵人賽

DAY 5

生成式 AI

LangChain、RAG、HuggingFace: 玩轉大語言模型系列第 5 篇

16th鐵人賽 ollama

nighting

團隊不時以註解遮羞的實習同學

2024-09-19 19:46:55

423 瀏覽

分享至

那本篇就來進入到本地部屬llm的部分!

本地部屬模型的幾種方法

將模型部屬至本地執行有很多方法，這邊已meta的Llama3為例，可以用Ollama平台，或是HuggingFace的transformer，也可以直接去meta的官方申請，再去它們的github專案下載。
我們今天就先來介紹使用Ollama來部屬本地模型。

Ollama

先來介紹一下Ollama這個平台

ollama是一個for AI 開發者的平台，他讓大語言模型（LLM）使用和開發所需要做的流程簡化直觀很多。提供了一個直觀的環境來運行、創建和管理模型，支援多個作業系統，包括 macOS、Linux， Windows 等等。
他能夠自動檢測使用最佳硬體配置，像是 NVIDIA GPU ，使 model 高效運行，不需要使用者做額外的配置。ollama 裡還有很完整的模型庫，像是自然語言處理和影像識別等等，讓 user 能輕鬆使用如 llama、gemma 等熱門模型。此外，Ollama 提供內建的 Always-On API，便於開發者將許多 AI model 的功能使用整合到自己的一些應用中，簡化了開發過程，讓開發者可以快速上手。

那我們就馬上開始用吧!
首先先去官網將SetUp檔載下來，依據PC的作業系統選擇